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(57) Abstract 

The invention concerns a novel cloning method based on the systematic, combined and preparatory use of restriction sites present 
on the Inserts constituting a complementary or genome DNA bank. The invention also concerns the applications of said method and the 
resulting banks. 

(57) Abr^gd 

La pr6sente invention conceme une nouvelle mdthode de clonage fondde sur 1 'utilisation syst6matique, combin6e, et pr6pardtive des 
sites de restriction presents sur les inserts constituant une banque d'AND compi6mentaire ou g6nomique. L' invention conceme egalement 
les applications de ce proc6d6 ainsi que les vecteurs pour sa mise en oeuvre et les banques obtenues. 
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PR0CfiD6 DE CLONAGE PAR DIGESTION MULTIPLE, 
VECTEURS POUR SA MISE EN OEUVRE ET SES APPLICATIONS. 

La presents invention concerne le domains ds 
la biologie mol6culaire et se rapporte plus 
particuli6rement au clonage de g^nes. 

Le clonage de genes est un domaine en pleine 
expansion qui vise notamment ^ associer fonctions et 
gfenes. Ce domaine se developpe principalement selon deux 
grands axes, d'une part la biologie moleculaire inverse, 
qui consiste A sequence de fagon massive des banques 
d'ADN g6nomiques ou complementaires, et d' autre part la 
biologie mol6culaire directe, qui consiste ^ trouver la 
sequence responsable d'une activite observee, comme une 
activity enzymatique ou une homologie avec d'autres 
g^nes . 

La presente invention vise precisement a 
offrir une nouvelle m^thode de clonage d'un fragment 
d' acids nucleique, designee aussi ci-apr^s DMD pour 
"Digestion Multiple Dif ferentielle", qui repose sur 
1' utilisation syst^matique, combinee, et preparative des 
sites de restriction presents sur les inserts 
const ituant une banque d'ADN complementaire ou 
gfendmique . 

La DMD s* applique notamment aux cas du 
criblage de banques d' expression et du clonage par 
homologie. 

La presente invention trouve egalement des 
applications dans le domaine fastidieux du sequencage 
quand celui-ci n'a qu'une activite d' identification des 
inserts, ainsi que dans l'6tude du polymorphisme humain, 
notamment dans le cadre de la recherche des 
predispositions genetiques. 

On designera ci-apres par Caracter istique 
Enzymatique (CE) la resistance, not6e "r" ou la 
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sensibility, not6e "s", d'un fragment d'acide nucl6ique 
h une enzyme de restriction. Ce qui signifie : 

- qu'un fragment qualifi6 "s" pour une 
enzyme de restriction donn^e contient le site de clivage 

de cette enzyme, et 

- qu'un fragment qualifife "r" pour une 

enzyme de restriction ne contient pas le site de clivage 

de cette enzyme. 

La Caract6ristique Enzymatique Multiple 

(CEM) est alors 1' ensemble des CE obtenues pour 

plusieurs enzymes. On peut alors reprfesenter la CEM d'un 

fragment d'ADN contenant un site Eco, un site Bam, deux 

sites Sea, mais pas de site Hind ni Stu, de la fagon 

suivante : Eco^Bam^Sca^Hind^ Stu" . 

Le proc6d§ de 1' invention propose done 
d'associer au fragment, que I'on cherche a isoler au 
sein d'un 6chantillon, sa caracteristique enzymatique 
multiple (CEM) . La recherche dudit fragment peut etre 
realisee par tout moyen connu de I'homme du metier, 
comme sa capacity a hybrider k une sonde nucleique. 
Inactivity enzymatique de son produit protfeique, 
1' expression d'une proteine que I'on pourra detecter, 
etc • • • 

Le precede de clonage selon 1' invention est 
fonde sur la demonstration que quand le nombre d' enzymes 
est suffisamment grand, chaque insert de la banque 
poss^de une CEM originale, et qu'en consequence, 
1' invention off re une stratfegie simple de clonage des 
genes k partir de leur CEM. Le precede selon 1' invention 
repose done sur le balayage de banques d'ADN en 
utilisant de fagon combinatoire la repartition des sites 
de restriction sur les inserts constituant cette banque. 

Le prineipe du proc^dy selon 1' invention 
repose egalement sur 1 ' utilisation d' un vecteur de type 
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nouveau car substantiellement d^pourvu de tous les sites 
de clivage par des enzymes de restrictions pour n'en 
garder que ceux n6cessaires ^ la construction de la 
banque, orient6e ou non, et ^ son eventuel sous-clonage 
dans un autre vecteur. Dans une forme particuli^re de 
realisation minimale, le vecteur contient : 

- un site A necessaire pour construire la 

banque, et 

- deux sites B, identiques et flanquant le 
site A, utile pour sous-cloner le g^ne une fois celui-ci 

identifi^ et clon6. 

Get ensemble pourra etre d^signfe ci-apr6s 
"trilinker", dont la fabrication schematique est donnfee 
a la ixguLe ± t=:ii 00.111^^^* 

Dans une autre forme particuli6re de 
realisation, le vecteur contient : 

- un site A et un site A', diff^rents, pour 
construire la banque, et 

deux sites B et B*, identiques ou 
differents, et flanquant les sites A et A\ pour sous- 
doner le g6ne une fois celui-ci identifi^ et clon6, 

Avantageusement les sites B sont des sites 
octonucl6otidiques, de fa^on a minimiser le risque que 
des sites B soient presents dans les inserts clones. II 
sera ainsi possible de sous-cloner facilement en un seul 
morceau . 

Environ 100 enzymes de restriction a site 
hexanucleotidique ont 6te decouvertes a ce jour. 70 
d'entre-elles ont un site de reconnaissance de type 
palyndrome continu ou discontinue 

Un vecteur de 1' invention, avantageusement 
un plasmide, ne contient plus, mis ^ part ces trois 
sites, de sites de restriction hexa ou penta- 
nucieotidiques correspondant a des enzymes de 
restriction dejA identifiees ou qui le seront dans le 
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futur. On entend done par "substantiellement"/ que cette 
destruction peut etre partielle en ce sens qu'elle ne 
concerne que certains des sites connus; seules les 
enzymes correpondantes seront alors utilis^es dans le 
precede de 1' invention. Dans l*expos6 de 1» invention qui 
suit, on consid6re, comme indiqu6 prfecedemment que 
environ 50 i 70 types de sites ont 6te dfetruits. 

Un vecteur de 1* invention peut §tre 
construit ^ partir d'un plasmide deja existant et 
poss^dant toutes les fonctions n6cessaires pour 
permettre d*y cr^er et d'y manipuler une banque d*ADNC 
ou g^nomique. II peut etre utile, dans le procede de 
1* invention, que la banque ne contienne plus de vecteur 
seul referme sur lui-meir.e. II est done avantageux que le 
vecteur de 1' invention contienne un systeme qui elimine 
tout vecteur seul referm^ sur lui-meme, comme un g^ne 
suicide, un systdme de disruption de la proximite d'un 
promoteur lambda ou tout autre systeme connu de I'homme 
du metier. 

La technique utilis^e, dans le cadre de 
1' invention pour detruire tous les sites de restriction 
est une des techniques de mutagenese dirigee simple ou 
multiple d^j^ d6crites dans I'art anterieur, ou tout 
autre technique connue par I'homme du metier, comme le 
remplacement de segments du plasmide par 
oligonucleotides. On obtient ainsi un vecteur resistant 
a 70 enzymes de restriction, numerotees de I a LXX, et 
sensible k 2, designees ci-avant A et B. L'idee de 
detruire simultanement la majorite des sites de 
restriction presents sur un plasmide a ^te envisag^e par 
D. H. Jones et al . (BioTechniques 1994, 16, 4 : 694) 
mais dans un contexte tout different. En effet, cet 
article d^crit la destruction par mutagenese multiple de 
31 des 37 sites d'un tres petit vecteur, de fagon A 
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cr6er un nouvel outil facilitant certaines manipulation 
de I'ADN. 

Le proced6 de 1' invention est par ailleurs 
bas6 sur la creation d'une banque d'ADN, laquelle selon 
!• application envisag6e contient de 1 k 10^ et de 
pr6f6rence de I'ordre de 10^ ^ 4.10^ fragments 
differents de I'ordre de 0,1 kb a 5 kb chacun, et de 
preference, selon les applications du proc6d6 de 
1' invention, de 1 a 2 kb. Dans le mode particulier de 
mise en oeuvre du proced6 de 1' invention d6crit i 
I'exemple 6 ci-apr6s concernant 1' etude du 
polymorphisme, la banque peut ne comprendre qu'un seul 

■F-rarrmont 

Ainsi, pour 1 * application du proc6de de 
1' invention ^ la fabrication de banques d' expression ou 
au clonage par homologie, il a ete prepare, comme 
represents schematiquement k la figure 2 en annexe, une 
banque d*ADNc de 10^ fragments differents de 1 kb 
chacun . 

Toutefois, ce module constitue une 
approximation et est done legerement faux, car la taille 
des fragments est hSterogene. La taille moyenne des 
inserts 6tant sous-estimee et la taille de la banque 
etant surestimee, ce modele a 6t6 choisi afin de 
disposer d'une base simple (homog6n6it6 de la taille des 
fragments) et d'un systeme d' Stude qui desavantage 
1' analyse (taille de la banque surestimee, taille des 
fragments sous-estimee) de fagon a ce que le precede de 
1' invention soit reproductible dans tous les cas. 

Pour 1' application du precede de 1' invention 
au Southern Blot d ' identification et a 1' etude du 
polymorphisme, il a §te prSparS, comme represente 
schematiquement a la figure 3 en annexe, une banque 
d'ADN gSnomique de 4.10^ fragments differents de Ikb 
chacun. Cette banque a ete obtenue par 1' utilisation 
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d'une enzyme correspondant ^ un site de frequence 
th6orique 1/1024 (de type AT(ACGT) (TGCA)TA). 

Tous types de banques d'ADN, tels que celles 
obtenus par amplification au hasard par PGR utilisant 
des oligonucleotides d6generes ou non, entrent dans le 
cadre de la presente invention. 

En consequence, 1* invention a pour objet un 
precede de clonage d'un fragment d'acide nucleique 
comprenant les 6tape suivantes : 

- on prepare une banque d*ADN susceptible de 

contenir ledit fragment/ 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de preference 50 a 70 
enzymes de restriction, pour isoler par tout moyen 
approprie le clone contenant ledit fragment. 

Dans ce proofed^, la preparation de la banque 
d»ADN susceptible de contenir le fragment d'acide 
nucleique, consiste a inserer chacun des fragments d'ADN 
d'un echantillon dans un vecteur depourvu de tout site 
de clivage par des enzymes de restriction ^ 

1* exception : 

- d'un site pour la construction de la 

banque, et 

^ventuellement de deux autres sites 
identiques, differents du premier ou des premiers 
site(s) et le(s) flanquant, utiles pour sous-cloner la 
sequence d'acide nucleique une fois celle-ci identifiee 
et donee- 

Dans une autre forme de realisation de ce 
precede, on insere chacun des fragments d'ADN d'un 
echantillon dans un vecteur substantiellement depourvu 
de tout site de clivage par des enzymes de restriction a 

1* exception : 

- de deux sites pour la construction de la 

banque, orientee, et 
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6ventuellement de deux autres sites 
identiques ou non, diff brents des deux premiers sites et 
le(s) flanquant^ utiles pour sous-cloner la sequence 
d'acide nucl6ique una fois celle-ci identifiee et 
5 clon6e. 

Le proc6d6 comprend plus particuliferement 

les etapes suivantes : 

a) on prepare une banque d'ADN susceptible 
10 de contenir ledit fragment d*acide nucleique, consistant 

^ insurer chacun des fragments d'ADN d'un ^chantillon 
dans un vecteur substantiellement depourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

15 - un ou deux sites pour la construction de 

la banque, et 

- ^ventuellement au moins deux autres sites, 

et de preference seulement deux sites, identiques ou 

non, et different du ou des premiers sites et le(s) 

20 flanquant, utiles pour sous-cloner le fragment d^acide 

nucl^ique une fois celui-ci identifie et clone. 

L'^chantillon a partir duquel sont issus les 
fragments constituant la banque peut §tre toute cellule 
eucaryote (mammifere, plante, levure, etc.), ou tout 

25 organisme procaryote {virus, bacterie, etc...), II peut 

s'agir d'ADN g6nomique, d'ADNc, de fragments 
d' amplification par PGR ou de tout autre banque d'ADN 
susceptible d'etre preparee par I'homme du metier. 

b) On realise la digestion en parallele de 
30 la banque par plusieurs enzymes de restriction, au moins 

10 et de preference environ 50 a 70 enzymes de 
restriction de fagon a obtenir autant de banques mono- 
diger^s que d' enzymes utilisees. 

c) On transfecte independamment les banques 
35 mono-digerees dans des hotes cellulaires appropries de 
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fagon i obtenir des lots correspondant d'hotes 
cellulaires. 

d) On teste par tout moyen approprie chacun 
des lots obtenus ^ I'etape (c) pour ^valuer 1' integrity 
de la sequence d'acide nucl6ique ^ doner et ainsi 

6tablir sa CEM. 

En effet, si la digestion par une enzyme 

designee "I" n'alt^re pas I'int^grite de 1' insert 

r 

present dans la banque, celui-ci est consider^ I , au 
contraire, si elle I'altere, celui-ci est considferfe I^. 

Les etapes (a) a (d) ci-dessus permettent 
1' analyse du fragment a doner selon 1' invention. 

Le precede de 1' invention comprend en outre 
les Stapes suivantes permettant de purifier le fragment 
ci doner : 

e) On reprend la banque totale de l*6tape 
(a) et on la digere sensiblement simultanement par les 
enzymes qui n*affectent pas l'int^grit6 du fragment a 
doner. Pour lesquelles il a done et^ considere "r". 

f) On isole le clone resistant contenant le 
fragment d'acide nucl^ique ^ doner par tout moyen 
approprie et eventuellement on le sous-clone en 
utilisant les deux sites menages dans le vecteur k cet 
ef fet . 

g) On sequence eventuellement le fragment 
d'acide nucleique ^ doner. 

La digestion multiple de I'etape (e) a pour 
effet de diver la totalite, ou la quasi-totalite, des 
fragments d'ADN constituant la banque, ci 1 'exception du 

fragment a doner. 

L^isoiement du clone resistant contenant le 
fragment d'acide nucleique ^ doner de l*6tape (f) peut 
etre realise par transformation de la banque multi- 
digeree dans des bacteries competentes, ou par PGR en 
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utilisant des oligonucleotides amorces flanquant le site 

de clonage de la banque. 

Eventuellement, par s6curite on peut 
effectuer des 6tapes de verification entre les etape (a) 
et (b) d'une part, et (e) et (f) d' autre part 
consist ant : 

a') A verifier la presence du fragment 
d'acide nucleique ^ doner dans la banque en 
transfectant dans un hote ceilulaire qui n'a pas ledit 
fragment et en testant par tout moyen approprie la 
presence du fragment dans ledit hote. Avantageusement , 
on utilise dans cette etape (a') des cellules COS, 
classiquement mise en oeuvre pour les transf ections . 

e') A transformer la banque multi-dig6ree de 
1* etape (e) dans des hotes competents de fagon a 
verifier la nature des fragments clones. Par exemple, 
cette etape consiste ^ etaler sur petri et verifier par 
minipreparations d'ADN plasmidique (miniprep) que les 
inserts sont bien sensibles aux enzymes notees "s" lors 
de 1' etablissement de la CEM, 

Avantageusement, la banque d*ADN preparee a 
1' etape (a) contient de 1 a 10^ et de preference de 
I'ordre de 10^ ^ 4.10^ fragments differents de I'ordre 
de 0,1 kb ^ 5 kb chacun, et de preference de I'ordre de 
1 a 2 kb. 

Dans le procede de 1' invention, on prefere 
que les deux sites de sous-clonage soient des sites 
octonucleotidiques, de fagon a minimiser le risque que 
des sites B soient presents dans les inserts clones. 

Dans un mode de realisation tout particulier 
du procede de 1' invention, la banque ne contient plus de 
vecteur seul referme sur lui-meme. II est done 
avantageux que le vecteur de 1' invention contienne un 
systeme qui elimine tout vecteur seul referme sur lui- 
meme, comme un g^ne suicide, un systeme de disruption de 
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la proximity d'un promoteur lambda ou tout autre syst^me 
connu de I'homme du metier, 

Les tests realises aux Stapes (d) et (a') 
pour verifier I'int^grite de la sequence d'acide 
nucl6ique k doner peuvent etre tout moyen de mise en 
Evidence soit de la sequence elle-m§me, comma une sonde, 
soit de la protfeine codee par ladite sequence, tel qu'un 
ligand comme un anticorps, ou encore de I'activite de 
cette prot6ine, comme un marqueur enzymatique, qui 
peuvent etre d6tectees par tout moyen connu de I'homme 
du metier, comme un marquage fluorescent ou radioactif . 

Les applications du proced^ de clonage selon 
1* invention sont tr^s nombreux et I'on peut citer 
notamment celles detaillees dans les exemples ci-apr6s : 

Le clonage d'un g^ne par banque 

d' expression, 

- Le clonage par homologie. 

- Le Southern Blot d' identification d^nomme 
par I'Inventeur "identiblot" . 

- L' etude du polymorphisme . 

Aussi, on designera indif feremment dans ce 
qui suit par g^ne ou insert ou sequence, le fragment 
d'acide nucleique a doner selon le procede de 
1* invention d^crit ci-dessus. 

Un precede de clonage d'un gene par banque 
d* expression selon 1' invention comprend les etapes 
suivantes : 

a) On prepare une banque d*ADNc susceptible 
de contenir ledit gene en inserant ladite banque dans un 
vecteur substantiellement depourvu de tout site de 
clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 
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- 6ventuellement au moins deux autres sites, 
et de prfef^rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le 
flanquant, utiles pour sous-cloner le gene une fois 
celui~ci identifie et clon6. 

b) On verifie la presence du gene recherche 
dans la banque en trans fectant dans une lign6e 
cellulaire qui n'a pas I'activite ou le phenotype 
recherche et en mesurant sa restauration par une 
technique permettant de distinguer les cellules 
transfectees des cellules non transfectees, par exemple 
par test cytom^trique ou enzymatique. 

c) On digere la banque ind^pendamment par au 
moins 10 et de preference environ 50 k 70 enzymes de 
restriction . 

d) On transfecte independamment les banques 

mono-dig^r^es de l'6tape (c) . 

e) On teste par tout moyen approprie chacun 
des lots obtenus a I'etape (d) pour la presence de 
I'activite associ6e au gene a doner et on evalue 
I'integrite de la sequence dudit g^ne afin d'etablir la 
CEM de I'activite associee audit gene. 

On entend par activite associee au gene la 
detection par tout moyen de la proteine codee par ledit 
gene ou de I'activite de cette proteine quelle qu'elle 
soit (ligand, enzyme, induction de tumeur, etc..,). 

f) On reprend la banque totale de I'etape 
(a) et on la digere sensiblement simultanement par les 
environ 50 ^ 55 enzymes qui, en moyenne, n'affectent pas 
I'activite mesuree a I'etape (e) . En consequence, 
statistiquement, tous les fragments constituant la 
banque seront clives, a 1' exception du fragment 
recherche . 

g) On transforme la banque multi-digeree 
dans des bacteries competentes. En consequence, seuls 



wo 99/28451 



12 



PCT/FR98/02629 



les vecteurs contenant un fragment non cliv6 seront 
transformes dans les bact^ries competentes. 

h) On sous-clone en utilisant la ou les 
enzymes correspondant au(x) site(s) de sous-clonage 
m6nag6(s) dans le vecteur, puis 6ventuel lament on 
sfequence le gene. 

L* invention concerne egalement, les banques 
mono- ou multi-digerees obtenues dans le proc6d6 de 
1' invention et notamment aux etapes (c) et (f) des 
procedes ci-dessus, ainsi que les supports, tels que des 
tubes, des membranes, des plaques, des gels, etc... qui 
peuvent contenir lesdites banques, leur produit 
d^ expression ou des hdtes les contenant. 

L* invention se rapporte aussi aux botes 
cellulaires ou bacteriens contenant les banques ci- 
dessus . 

Un proc^d^ de clonage par homologie selon 
1* invention comprend les etapes suivantes : 

a) On prepare une banque d'ADNc comme deer it 

a l*6tape (a) precedente. 

b) On digere la banque independamment par 
chacune d'au moins 10 et de preference environ 70 
enzymes de restriction. 

c) On transforme les produits de la 
digestion de I'etape (b) dans des bacteries competentes . 

d) On fait pousser les bacteries 
transformees en milieu selectif, de fagon a produire des 
banques digerees debarrassees des produits clives. 

e) On clive separ^ment chacune de ces 
banques par la ou les enzymes correspondant au(x) 
site(s) de sous-clonage m6nag6(s) dans le vecteur et 
I'on depose separement chacun de ces produits de 
digestion dans un puits de gel d' agarose ou 
d ' acrylamide . 
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f) On fait migrer les produits de digestion 
de l'6tape (e) , puis I'on transf^re sur membrane par 
exemple de nitro-cellulose, et I'on hybride avec une 
sonde specif ique du gene k doner par homologie, ou bien 
I'on depose directement les produits de I'etape (d) sur 
une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon a ce que le seul clone 
resistant soit le vecteur portant le g6ne a doner. 

Le proc6d6 de clonage par homologie ci- 
dessus peut §tre applique a 1 ' identification : 

a) d' alleles de diffferentes souches 
d'animaux de la meme esp^ce, ou de differents individus 
Chez I'homme (souvent tres homologues) . 

b) d' equivalents g6niques presents chez 
differentes especes (moder6ment homologues) . 

c) d'^pissages alternatifs d'un m§me g^ne au 
sein d'un m^me tissu ou entre differents tissus 
(homologie totale par sections) . 

d) de differents membres d'une famille 
g6nique, distribute au sein d'un meme tissus ou dans 
differents tissus. (homologie imprevisible, souvent tres 
forte dans certains domaines) . 

La version simplifite de ce proc6de consiste 
h effectuer des dots au lieu de Blots, c'est-a-dire a 
s'abstenir de cliver les banques mono-digerees par 
1' enzyme correspondant au site de sous-clonage menage 
dans le vecteur, et de les deposer directement en un 
point sur une membrane de nitro-cellulose . 

Un proc6d6 de Southern Blot d' identification 
d' inserts selon 1' invention permet d' identifier un 
fragment d'ADN sans avoir a le sequencer meme 
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partiellement . Ce proc6de comprend les 6tapes 
suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit insert, consistant a insurer chacun 
des fragments d'ADN d'un 6chantillon dans un vecteur 
substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- ^ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner 1* insert une fois 
celui-ci identifie et clone. 

b) On digere cette banque par chacune d'au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction, 

c) On transforme les banques monodigeres 
obtenues ^ l'6tape (b) ci-dessus dans des bact^ries 
comp^tentes, ou des hotes equivalents. 

d) On fait pousser les bact^ries en milieu 
s61ectif, de fagon ^ produire des banques monodigerees 
debarassees des produits cliv^s. 

e) On clive s^parement chacune de ces 
banques par 1' enzyme correspondant aux deux autres sites 
identiques et different du premier ou des premiers 
site(s) et le(s) flanquant, et on depose les produits de 
digestion dans les puits d'un gel d* agarose ou 

d' acrylamide, 

f) On fait migrer ce gel et on le transfere 

sur une membrane par exemple de nitrocellulose. 

g) On utilise les inserts a identifier comme 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen appropri^ chacun 
des lots obtenus a I'etape (g) pour associer les inserts 
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^ identifier i une CEM. Cette CEM correspond a 1' action 
des enzymes de l'6tape (b) . 

Un proc6de d' etude du polymorphisme selon 
!• invention est identique au proc6d6 de Southern Blot 
d' identification d' inserts mais est caracterise en ce ce 
que : 

- La banque d'ADN genomique de I'etape (a) 
est issue du sujet etudie, par exemple d'un malade, ou 
de sujets de la famille du malade. 

- Les inserts utilises comme sondes sont des 
marqueurs de polymorphisme d^j^ d^crits. 

Le precede d* etude du polymorphisme selon 
1* invention trouve son application soit dans le cadre de 
la recherche de marqueurs du polymorphisme associes a 
une pathologie, soit dans le cadre d'un diagnostic de 
cette pathologie, 

Une variante du procede de clonage precedent 
pour 1' etude du polymorphisme d'un individu comprend les 

etapes suivantes : 

a) On dfefinit la CEM de chacun des marqueurs 
connus de fagon a permettre leur identification. 

b) On constitue une banque d'ADN genomique 
du sujet etudie consistent a ins6rer chacun des 
fragments d'ADN d'un 6chantillon dans un vecteur 
substantiellement d^pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 

et de preference seulement deux sites, identiques ou 

non, et different du ou des premiers sites et le(s) 

flanquant, utiles pour sous-cloner 1' insert une fois 

celui-ci identifie et clone. 
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c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 

aux marqueurs 6tudi6s. 

d) On transforme les banques multidig6r§es 
dans des bactferies comp6tentes . 

e) On cultive ces bacttries en milieu 
liquids ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bact6ries 
poussent, par centre, si cat allele a' existe pas^ elles 
ne poussent pas, et l*on dispose ainsi d*un profil pour 

chaque allele. 

Avantageusement, a I'etape (b) , on prepare 
une banque dont les fragments ont une longueur moyenne 
de 1000 a 4000 et de preference de 2000 nucleotides- 

Un mode de realisation de la variante ci- 
dessus permet egalement la detection des nombreux 
alleles de segments polymorphes, comme par exemple la 
gpl20 des virus HIV ou la p53 d' oncogenes cellulaires, 
dans le cadre de travaux de recherche ou d'un 
diagnostic. Le segment concern^ est avantageusement 
amplifie par PGR et clone dans le plasmide, puis le 
procede est identique a celui deer it precedemment et 
expose en detail dans 1' exemple 6 ci-apres. 

L' invention a aussi pour objet un melange 

d'au moins 10 et de preference de 50 a 70 enzymes de 

restriction susceptible d'etre utilise dans un procede 
selon 1 * invent ion . 

L' invention concerne encore 1 'utilisation 

d'un vecteur substantiellement depourvu de tout site de 

clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 

d'une banque, et 
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- 6ventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 

ladite banque, 

pour cribler une banque d'ADN. 

L* invention a done aussi pour objet une 
banque d'acide nucl6ique clonee dans un vecteur, 
susceptible d'etre preparee dans un proc6de decrit 
pr6cedemment, caract6ris6 en ce que ledit vecteur est 
substantiellement depourvu de tout site de clivage par 
des enzymes de restriction mais conserve : 

- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 

et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

Avantageusement, ledit vecteur porte un 
systeme qui elimine tout vecteur seul referm6 sur lui- 
m§me . 

L' invention se rapporte aussi a : 

- une banque d'ADN multi-digeree par un 
melange d' enzymes decrit precedemment, 

- groupe de banques d'ADN ou chaque banque 
est mono-digeree independamment par chacune des enzyme 
du melange d' enzymes decrit precedemment, 

ainsi qu'aux h6tes cellulaires ou bacteriens 
ou les supports contenant une banque ou un groupe de 
banques ci-dessus. 

D' autres avantages et caracteristiques du 
proc^d^ de 1' invention apparaitront dans la description 
qui suit se rapportant a des exemples detailles de mise 
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en oeuvre du procede de 1 * invention dans di verses 
applications qui ne sauraient etre consider6s comme une 
limitation quelconque de 1' invention. 

p .v^mplf^ 1 : La preparation et 1 ' exploitation 
d'une banquet d ' g^xpression . 

Une premiere application du procede de 
1* invention se rapporte a la preparation et ci 
1 'exploitation d*une banque d'expression. 

Cette technique suscite depuis le milieu des 
ann6es 1980 un grand int6ret. De nombreux genes, comme 
ceux codant pour des recepteurs aux cytokines, des 
marqueurs de surface des lymphocytes, des prot^ines 
iiant I'ADN, etc... ont ete identifies par cette 
technique (U. Gubler et al . , Annals of the N. Y. Academy 
of Science 795 : 36-40, 1996 ; D. Pennica et al. PNAS 
92(4) : 1142, 1995 ; R. M. O'Brien et al . , Biochemical 
Journal 312 : 17 - 21, 1995) . Toutefois, les techniques 
de clonage par banque d' expression sont tou jours 
fastidieuses et dif f icilement reproductible s a ce jour. 

Les applications actuelles des banques 
d' expression concernent 1 ' identification du gene codant 
pour une proteine, dont les moyens de mise en evidence 
peuvent etre regroupe en quatre categories principales : 

- les anticorps, 

les liaisons proteine/proteine autre 

qu' anticorps/antigene, 

- les oligonucleotides marqu6s par exemple 
par fluorescence dans le cas ou la proteine recherch^e 
est une proteine se liant a I'ADN, 

les tests d'activite de la proteine, 

quelle qu'elle soit . 

La banque contenant le gene codant pour la 
proteine recherchee peut etre transform^e dans des 
bacteries ou des levures, et I'on utilise 1' anticorps, 
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la prot6ine ou 1' oligonuct^otide marqu6 pour balayer la 
banque A la recherche de la colonie qui I'exprime. Ces 
systfemes marchent souvent tr^s mal, car les prot6ines 
n'ont pas la m§me conformation et les memes 
modifications post-traductionnelles chez les bacteries 
ou levures et chez les cellules mammifdres. 

Le probl^me de la transfection de banques 
dans les cellules mammifferes reside dans le fait que, ^ 
la difference des systemes de bacteries ou de levures, 
plusieurs plasmides sont int^gres dans chaque cellule. 
Pour contenir cette difficult^, il est n^cessaire 
d'utiliser des techniques de f ractionnement successif 
des banques, ou de tris cytof luorim6triques reputes (T. 
Kitamura et al-, PNAS 92 (20) : 9146, 1995 ; D. 
Gehlert et al., Molecular Pharmacology, 4 9 (2) : 224, 
1996) . Chacune de ces deux techniques represente un 
travail important, tr^s long (plusieurs semaines) , qui 
n'est pas tou jours conclusif, et qui n'est pas adapte au 
clonage simultan6 deux inserts ou plus. 

Le precede de 1 ' invention est beaucoup plus 
simple et moins coOteux que tous ceux de I'art ant^rieur 
cite ci-dessus. De plus, il peut etre applique au 
clonage simultan6 de plusieurs inserts.' Ce dernier point 
revet une importance majeure lorsqu'on salt que beaucoup 
de proteines de surface sont composees de plusieurs 
chalnes et n'atteignent la surface que lorsque toutes 
les chaines sont produites, par exemple dans le cas des 
complexes majeurs d' histocompatibility . Or aucune des 
techniques de I'art anterieur basee sur les banques 
d' expression ne permet d' avoir acc6s a ces proteines. 

Un precede de 1* invention pour la 
constitution de banques d' expression comprend les etapes 
suivantes' : 

a) On prepare une banque en inserant dans le 
site A du vecteur I'ADN compiementaire du tissu ou de la 
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lign6e cellulaire d'inter^t. La figure 2 en annexe est 
une representation sch6matique de cette etape. 

b) On.verifie la presence du gene recherche 
dans la banque en trans fectant dans une lignee 
cellulaire qui n'a pas I'activite ou le phenotype 
recherche et en mesurant sa restauration, par exeitiple 
avec un anticorps, de fagon a distinguer les cellules 
transfectees { + ) des cellules non transfectees (-) . La 
figure 4 et 5 en annexe sont une representation 
schematique de cette etape. 

Avantageusement , on utilise des cellules 
COS, classiquement mise en oeuvre pour les 

transfect ions . 

c) On digere la banque independamment par 
chacune des 50 ^ 70 enzymes de restriction disponibles. 
On obtient ainsi 50 a 70 tubes. La figure 6 en annexe 
est une representation schematique de cette 6tape, 

d) On transfecte independamment les 50 a 70 
banques . mono-diger6es, et tester la presence de 
I'activite recherch^e dans chacun de ces 50 a 70 lots de 
cellules transfectees. La figure 7 en annexe est une 
representation schematique de cette etape. 

e) On etablit ainsi la CEM de I'activite 
recherchee. Si la digestion par 1' enzyme I n'alt^re pas 
I'activite de 1' insert present dans la banque, on notera 
I^. Si elle I'aitere, on notera I^. 

On obtient, dans I'exemple de la figure 7 en 

s r r 

annexe, la CEM suivante: I II . . .LXX . 

En moyenne, on estime que 55±4 enzymes sur 
70 auront un r, et 15±4 auront un s pour un insert de 1 
kb. En effet, la probabilite de clivage par une enzyme 
de restriction k site hexanuclueotidique, ^ une position 
donnee prise au hasard, est p = 1/4^ = 1/4096. Sur un 
g^ne dont la taille est n nucleotides, la probabilite 
theorique d'avoir 1, 2, 3, ... clivages suit une loi 
binomiale de probabilite p et de nombre d'^v^nements n. 
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La probability de n' avoir aucun clivage est Cn^P^d-p)"- 
Dans le cas oil n = 1000, on obtient une probability de 
78,3%. La probability d' avoir un clivage ou plus est 
d*environ 21,7 %. Le nombre moyen d'enzymes ne clivant 
pas est done de 0,783 x 70 = 55, et I'ecart type est 
proche de 4 . 

f) On reprend la banque totale et on la 
digere sensiblement simultanement par les 55 enzymes qui 
n'affectent pas Inactivity mesurye qui est associye a 
"r" pour 1* insert recherche. La figure 8 en annexe est 
une representation schymatique de cette etape. 

En pratique, cette digestion ne peut etre 

^, ^ 1 ^ — .-^A/-> ^^n-^ rAfjiCf r^a-icnnc; H@ C^^na."'" ibi 1 it ^ 

t.OLa±eiUtiri U iaxim-i-n-cnici^ ^v^i^o. uc:»-> j-v^j.^^**-* i- -> 

de tampons, et I'on est obligy de 2 ou 3 multi- 
digestions successives correspondant aux deux ou trois 

tampons choisis. 

La probability pour un insert pris au hasard 

d'etre clive par x de ces 55 enzymes suit aussi une loi 
binomiale, de probability 0,783 et de nombre 
d^yvenements 55. La probability pour un insert de n'etre 
clivy par aucune des 55 enzymes est done C55O x 
(0,783)5^ X (1 - 0,783)0 = (0,783)^5 = 1,4.10-^. 

II ne reste done, en moyenne, que 1 ' insert 
recherche, plus 1,4.10'*'^ x 10^ = 0,14 insert parasite, 

L' utilisation partielle de la CEM, 
correspondant uniquement aux enzymes associyes a un r, 
est suffisante pour isoler le g^ne recherchy, lequel est 

dyja pur k plus de 85%. 

g) On transforms la banque multi-digyrye 
dans des bactyries compytentes. Avantageusement on etale 
sur petri et I'on vyrifie par miniprep que les inserts 
sont bien sensibles aux enzymes notyes "s" lors de 
I'ytablissement de la CEM. La figure 9 en annexe est une 
representation schematique de cette ytape. 
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h) On sous-clone en utilisant 1' enzyme B 
dans un vecteur d'6tude, tel que Bluescript. Puis 
avantageusement on sequence. 

5 Le modfele d^crit ^ I'^tape (e) ci-dessus est 

conforme t la r6alite, mais ne repr6sente qu^une 
moyenne. En effet, la probabilite de clivage varie d'une 
enzyme de type site hexanucl^otidique ci une autre. 

10 Chacune de ces 8 stapes ne demande que tr^s 

peu de temps, puisque le proced^ ci-dessus devrait peut 
etre realise en 16 jours dont 10 de travail. 



Le proc^de de 1 ' invention permet notamment 
15 de generer des banques d' expression pour de nombreux 

tissus et lignees, puis en faire les 50 a 70 simples 
digestions, les transfecter, faire I'extrait cellulaire 
de ces cellules transfectees, et les deposer sur une 
membrane comme represents a la figure 10, 
20 II ne reste alors plus qu'a r^v^ler la 

membrane par exemple avec un anticorps selon la 
technique dite de Western blot, afin d'obtenir 
immediatement la CEM de 1' insert recherchS comme 
represente sur la figure 11. La banque est alors multi- 
25 dig§r6e en fonction de la CEM obtenue, puis on 

transforme des bacteries competentes avec ce produit 
multi-dig^re, et le gene est clone en 3 jours au lieu de 
plusieurs mois par les techniques de I'art anterieur. 

On peut conserver ces membranes ad vitam 

30 aeternam a 4*^0 ou congelees. 

L' exemple ci-dessus est bas6 sur 
I'utilisation d*un anticorps specifique mais d'autres 
systemes de revelation du phenotype associe ^ la CEM 
peuvent §tre utilises, comme un test enzymatique. 

35 

F.xfimple 2 : Le clo naae oar homolooie. 



wo 99/28451 



23 



PCT/FR98/02629 



Le clonage par homologie est intensivement 
utilise par de tr^s nombreux laboratoires de biologie 
mol6culaire pour 1 * identification : 

a) d' alleles de differentes souches 
d'animaux de la in§me esp6ce, ou de diff^rents individus 
Chez I'homme (souvent tr^s homologues) - 

b) d' Equivalents g6niques presents chez 
differentes esp^ces (moderement homologues) . 

c) d'epissages alternatifs d'un m§me g^ne au 
sein d'un meme tissu ou entre differents tissus 
(homologie totale par sections) . 

d) de differents membres d'une famille 
g^nique, distribute au sein d'un meme tissus ou dans 
differents tissus. (homologie impr6visible/ souvent tr^s 
forte dans certains domaines) , 

Les strategies utilis^es dans I'art 
anterieur sont essentiellement les deux suivantes (M. 
Parmentier et al Nature, 355 : 453, 1992) : 

- La PGR par homologie et ses derives, 
lesquels soulevent le probleme du choix des amorces 
alors que I'on ne connalt pas les parties conservees. La 
fenetre entre le bruit de fond aspecifique et les vraies 
amplifications homologues est etroite. De plus, la 
partie amplifiee ne represente le plus souvent pas tout 
le gene et on est alors oblige d'aller chercher les 
morceaux manquants, et notamment la partie en 5' , par 
des techniques laborieuses comma la PGR ancree . 

L' hybridation de banques existant 
actuellement . Gette methode est efficace, mais necessite 
beaucoup de travail. En outre, elle ne s' applique qu'a 
1 • identification d'alieies (a) ou d'equivalents geniques 
(b) . Pour 1' identification des epissages alternatifs (c) 
ou des differents membres d'une famille genique (d) , on 
redone toujours I'ADNc majoritaire, done dans la 
plupart des cas, le gfene dont on dispose dej^. 
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Le proc6de de 1' invention permet une fois 
qu'on a clon6 un g6ne, de produire une sonde qui 
s'hybride sur des g^nes homologues. On utilise done 
cette sonde pour pecher ses homologues par hybridation ^ 
faible stringence. 

Le proc^de de clonage par homologie selon 
1* invention comprend les 6tapes suivantes : 

a) On prepare une banque d'ADNc comme d6crit 

^ l'6tape (a) de I'exemple 1. 

b) On digere la banque independamment par 
chacune des 70 enzymes de restriction comme comme d^crit 
a l*etape (c) de I'exemple 1. 

c) On transforme ces 50 a 70 digestions dans 
des bacteries competentes. La figure 12 en annexe est 
une representation schematique de cette 6tape. 

d) On fait pousser les bacteries 
transformees en milieu selectif, de facon a produire des 
grandes quantit^s des banques digerees debarrassees des 
produits clives (non transf ormants en raison de leur 
linearisation) . Les elements clives sont desormais 
absents des banques. La figure 13 en annexe est une 
representation schematique de cette etape. 

e) On clive separement chacune de ces 
banques par 1' enzyme B. La figure 14 en annexe est une 
representation schematique de cette etape. 

On depose alors separement chacun de ces 50 
k 70 produits de digestion dans un puits de gel 
d' agarose, comme represents a la figure 15 en annexe. 

Puis, on fait migrer, I'on transf ere sur 
nitro-cellulose, et I'on hybride avec la sonde, comme 
represents a la figure 16 en annexe. 

f) On analyse la CEM du signal. Ainsi, si 
une bande est presente dans la piste "banque non 
digeree", mais absente dans la piste "banque digeree par 
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I", c'est que 1' insert hybrid^ est sensible a 1' enzyme 

I, et ainsi de suite. 

g) On fait les multi-digestions 

correspondantes, et le seul plasmide resistant est le 

5 plasmide recherche, Avantageusement , on peut ensuite 

faire des minipreps avec ce plasmide en utilisant les 
enzymes ''s'' pour confirmer. 

Ce proc^d^ peut etre utilise 

10 industriellement, en proposant les Blots correspondant k 

de nombreuses banques, comme celles realis6es dans 
1* example 1. Ainsi, en disposant de la sonde et des 
Blots judicieusement choisis, il devient quasi immediat 
de trouver tous les alleles, correspondants d'esp6ce, 

15 epissages alternatifs et isotypes (deux jours de 

travail, sans compter le sequengage) . 

Une version simplifi^e de ce proc6d6 
consiste a effectuer des Dots au lieu de Blots, c'est-a- 
dire a s'abstenir de cliver les banques mono-dig6r6es 

20 par 1' enzyme B, et a les deposer directement en un point 

sur une membrane de nitro-cellulose . Lors de 
1' hybridation avec la sonde, les points g^nerant un 
signal, par exemple radioactif, correspondraient aux 
enzymes pour lesquelles le plasmide serait resistant. 

25 Ceux ne retenant plus de signal correspondraient aux 

enzymes pour lesquelles 1' insert est sensible. L' analyse 
est alors proche de celle developpee dans 1' exemple 1, 
comme representee aux figures 17 et 18 en annexe. 

30 Cette version simplifiee est cependant 

insuffisante pour doner des isotypes ou des epissages 
alternatifs exprimes dans une meme cellule. 



Rxpmole ! Son thfirn Blot, ident i f i c^t ipn 
35 "identiblot " . 
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Les applications precedentes du proc6d6 de 
1' invention visent a simplifier et rendre plus rapide le 
clonage par expression ou par homologie et en offrant de 

nouvelles possibilit^s . 

Le Southern Blot d' identification propose un 
raccourci qui faciliterait les travaux du chercheur 
impliqu^ dans les techniques de clonage moleculaire. 

En effet, Le cas est frequent dans I'art 
anterieur ou une strategic de clonage aboutit k 
I'obtention de nombreux inserts, parmi lesquels se 
trouve le gene recherche et de nombreux parasites. Or 
dans l»art anterieur, pour identifier un insert parmi 
tous ces parasites, il est est indispensable de le 
sequencer, au moins partiellement , ce qui represente un 
travail considerable. Le s^quengage est une technique 
fastidieuse et trop puissante pour ce simple usage 
d' identification d' inserts, en effet la lecture de 10 
nucleotides suffit le plus souvent a identifier un 
insert. Un technique moins puissante, mais moins 
fastidieuse, utilisant la DMD, pourrait iui etre 
substitute . 

Ainsi, comme decrit precedemment , il est 
possible de faire des Southern Blots de banques d'ADN 
g§n6mique de fagon industrielle . Une representation 
schematique de la preparation d'une telle banque d'ADN 
g^nomique est donnte k la figure 3 en annexe. Ce 
Southern Blot, rebaptise "identiblot" dans le cadre de 
la presents invention est suffisamment informatif pour 
permettre 1' identification du fragment d'ADN homologue 
de la sonde. 

Ce southern blot est meme cent millions de 
fois trop informatif. En effet, la banque genomique est 
constituee de 4 millions d' inserts differents de 1 kb de 
long. Pour les memes raison que celles exposees 
precedemment, un insert pris au hasard sera resistant k 
55 enzymes sur 70 et sensible a 15. Le nombre de 
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combinaison enzymatique possible est done C70-^^r soit 
70!/ (55! 15!) = 7,2.10^^. Ce nombre est plus de cent 
millions de fois sup^rieur A la taille de la banque. Le 
fait de consid6rer que les inserts ont tous une taille 
diff6rente ajoute encore des possibilitfes . Chaque insert 
de la banque est done assocife ^ une CEM originale. 

Ce proc6d6 pr6sente un int6r§t majeur dans 
le cas de strategies de clonages aboutissant a de forts 
taux de clones faux positifs, par example dans les cas 
de 1' utilisation de banques soustractives . ou de 
strategies de clonage par insertion. 

En effet, k partir des cinquante clones 
6tudies; il suffit de preparer une "sonde multiplex", 
c'est a dire un marquage commun de cinquante inserts 
(dans un seul tube) , et une seule hybridation du filtre 
de nitro-cellulose. On obtient 1' identity des cinquante 
inserts d'un seul coup, en comparant leurs CEM avec 
• celies pr6alablement entrees dans une base de donn^es 

informatique. 

La figure 19 en annexe represente un example 
ou trois sondes A, B, et C ont 6te utilis6es 
simultan^ment , Les inserts genomiques correspondant a 
des CEM non deer it as, et eux seuls, seront donees par 
exemple par multi-digestion, puis sequences. 

A 1' inverse du cas des banques d'ADNc, dont 
la variete est insondable, il est suffisant de produire 
un seul type de Blot, pour chacune des 10 especes 
etudiees couramment en biologie : humain, souris, rat, 
drosophile, tabac, levure, etc... 

Example 4 : Etude du pQlvmorphisme humain . 



Les travaux de recherche menes dans le cadre 
de 1' etude du polymorphisme necessitent 1 ' utilisation 
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d'un nombre croissant de marqueurs g6n6tiques. Leur 
utilisation dans le cadre du diagnostic des maladies 
g6n6tiques est 6galement en forte augmentation, II est 
probable que dans un futur proche des cartes 
personnelles de predisposition g6netique pourront §tre 
Stabiles, de fagon h ce que chacun evite de s'exposer k 
certains risques environnementaux, corame le tabac en cas 
de predisposition au cancer du poumon^ le sucre pour les 
terrains diabfetiques, etc.... 

Les techniques disponibles dans 1 ' art 
ant^rieur permettant d'etudier le polymorphisme sur un 
allele sont principalement la PGR, le Southern Blot et 
1' etude des marqueurs de I'ADN satellite 
(potent iellement utilises en combinaison) . La m6thode de 
1' invention constitue done une alternative, plus 
efficaces, k ces techniques. 

La mise en oeuvre du proc6de de clonage 
selon 1' invention pour 1' etude du polymorphisme humain 
est proche de celle de I'exemple 3 ci~dessus. La 
difference majeure reside dans le fait qu'il est 
necessaire de rfealiser la banque, ses digestions, la 
migration sur gel et le transfert sur membrane, pour 

chaque sujet. 

Ce precede permet egalement de localiser 
tr^s rapidement I'origine d'une maladie g^n^tique par 
1' analyse des diffferents membres de la famille h^bergeant 
la pathologie. Dans une famille dite "a risque" pour une 
pathologie, il convient de faire les Identiblots 
correspondant aux differents membres de la famille, et de 
les tester au moyen de polysondes faites a partir des 
marqueurs g^n^tiques deja existants. En un jour, on peut 
hybrider au moins vingt membranes, soit obtenir 1' allele 
de 1000 marqueurs. Les facteurs genetiques multiples 
pourraient etre definis avec cette technique. 

Cette application du precede de 1* invention 
implique un investissement en temps de I'ordre de 
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plusieurs heures de travail, mais est rapidement 
rentabilis6 par la possibilite de tester les marqueurs 
de predisposition g^netique 50 par 50, au moyen de 
sondes multiplex pr6parees en routine et constitutes du 
nombre equivalent de marqueurs. 

Fxf^mple 5 : Deuxieme appr onhe de I'fetude du 
pnlvmorpb i -<^mP humaln selon 1' invention, 

Cette seconde mise en oeuvre du procede de 
1' invention a 1' etude du polymorphisme concerne 
1» application de la DMD ^ l'6tude des marqueurs 
gen6tiques par RFLP. Le procede selon 1* invention 
comprend aiors les etapes suivantes : 

a) On a prealablement definis la CEM de 
chacun des marqueurs connus de fagon a permettre leur 
identification. Cette identification est faite une fois 
pour toutes et un polymorphisme est done caracterise par 
une variation de la CEM. 

b) On constitue une banque d'ADN gtnomique 
du sujet etudie dans le vecteur precedemment decrit. 
Comme indiqut pr6cedemment , il peut etre avantageux que 
les vecteurs seuls ligues sur eux-m§mes soient elimin6s. 
Avantageusement, on prepare une banque dont les 
fragments ont une longueur moyenne de 2000 nucleotides. ■ 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs etudits. 

Ainsi, par exemple, dans le premier puits, 
on met les cinquante enzymes qui vont digerer toute la 
banque sauf un premier marqueur. Dans le second puits, 
on met une autre batterie d' enzymes pour un second 

marqueur, etc. . . 

d) On transforme les banques multidigerees 

dans des bacteries compttentes. 
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e) On cultive en milieu solide (boite de 
petri) contenant 1' agent selectif du plasmide de fagon k 
ce que si 1' allele recherche existe, les bact^ries 
poussent. Par centre, si cet allele n'existe pas, elles 
ne poussent pas. On dispose ainsi d'un profil pour 
chaque allele, et I'on peut etudier un nombre illimite 
de marqueurs en une seule fois. 

Ce proc6d6 peut §tre automatise en pr6parant 
des plaques de 96 puits contenant tous les melanges 
enzymatiques, ces plaques sont stock^es en congfelateur, 
Diff6rents types de plaques pourraient etre produites: 

- Marqueurs repartis sur tout le genome. 

- Marqueurs repartis sur un seul chromosome . 

- Marqueurs repartis sur une region precise. 

Marqueurs relies aux risques de 

pathologies . 

"* £tC • • • 

On distribue dans chaque puits une quantity 
fixe d'ADN sous forme de banque, puis l*on incube cl 37 °C 
pour les digestions. On rajoute alors les bacteries 
comp^tentes, et on suit le m^canisme classique de 
transformation (choc thermique, incubation sans agent de 
selection, etc.-.). On preleve a la pipette 96 canaux et 
I'on depose sur un p^tri. La lecture est effectu6e a 
I'oeil ou I'aide d'un spectrophotom^tre . 

Cette seconde approche off re I'avantage 
d'etre facilement automatisable, et confere a grande 
echelle un gain de temps tres important. En effet, il 
faut tester un grand nombre de marqueurs pour chaque 
individu, car la creation de la banque represente un 
investissement en travail. En outre, elle permet de 
s'exonerer de toute radioact ivite, coOteuse et nocive. 



Exemple 6 : Troisieme approche de 1 ' etude du 

p hnmain selon 1 ' invention . 
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Cette variants du proc6de d»6tude du 
polymorphisme humain selon 1' invention se rapporte k 
1' application de la DMD k l'6tude des differents alleles 
d'un seul marqueur. 
5 Dans I'art ant^rieur, ces differentiations 

se font essentiellement par s^quengage. Dans un futur 
proche, les puces d'ADN (T. Pastinen et al,, Genome 
Research 7 : 606-14, 1997 ; J. G. Hacia et al,, Nature 
Genetics, 14 : 441, 1996), permettront d' automatiser ces 
10 travaux. Ceux-ci sont particuli^rement utiles dans le 

cas de I'examen de la gpl20 du virus HIV ou d* oncogenes 
cellulaires tels p53, presents sous de nombreux alleles. 

Conform6ment k la presente invention, cette 
variante consiste k pr^alablement d^finir la CEM de 
15 chacun des alleles du segment etudi6. Cette 

identification est realisee une fois pour toute et se 
limite aux alleles comportant au moins un site de 
restriction de difference. Puis on amplifie par PGR le 
fragment ^tudie. On clone ledit fragment dans le vecteur 
20 de 1' invention. Ce precede est done tres proche de celui 

de I'exemple 5, mais avec une banque comportant 
seulement un ou deux inserts correspondant aux deux 
copies du gene present chez un individu. La suite de ce 
proc§d6 est identique k celle de I'exemple 5. 
25 Ce travail peut etre realise simultanement 

sur plusieurs inserts a la fois. 
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RRVKNnTCATIQNS 

1) Proc6ci6 de clonage d'un fragment d'acide 
nucleique, caract^rise en ce qu'il comprend les etape 

5 suivantes : 

- on prepare une banque d*ADN susceptible de 
contenir ledit fragment d'acide nucleique a doner, 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de pr^f^rence 50 h 70 

10 enzymes de restriction, pour isoler par tout moyen 

appropri6 le clone contenant ledit fragment . 

2) Procede selon la revendication 1, 
caracterise en ce que la preparation de la banque d'ADN 

15 susceptible de contenir le fragment d'acide nucleique ci 

doner, consiste a insurer chacun des fragments d'ADN 
d'un 6chantillon dans un vecteur substantiellement 
d^pourvu de tout site de clivage par des enzymes de 
restriction mais conservant : 

20 - un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 

25 flanquant, utiles pour sous-cloner le fragment d'acide 

nucleique une fois celui-ci identifie et clone. • 

3) Procede de clonage d*un fragment d'acide 
nucleique selon I'une des revendications 1 a 2, 

30 caracterise en ce qu'il comprend les 6tape suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir le fragment d'acide nucleique, consistant ci 
insurer chacun des fragments d'ADN d'un echantillon dans 
un vecteur substantiellement depourvu de tout site de 

35 clivage par des enzymes de restriction mais conservant : 
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- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 

et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucl6ique une fois celui~ci identifie et clone. 

(b) On realise la digestion en parallele de 
la banque par plusieurs enzymes de restriction, au moins 
10 et de preference environ 50 a 70 enzymes de 
restriction de fagon obtenir autant de banques mono- 
diger§s que d' enzymes utilisees. 

(c) On trans feet e independamment les banques 
mono-dig6r6es dans des hOtes cellulaires appropries de 
fagon a obtenir des lots correspondant d'hStes 
cellulaires. 

(d) On teste par tout moyen approprie chacun 
des lots obtenus a l'6tape (c) pour ^valuer 1' integrity 
du fragment d'acide nucleique k doner et ainsi etablir 
sa CEM. 

4) Precede selon la revendication 3, 
caract6ris6 en ce qu'il comprend les Stapes suivantes : 

(e) On reprend la banque totale de I'etape 
(a) et on la dig^re sensiblement simultan^ment par les 
enzymes qui n'affectent pas 1 ' integrite du fragment 
d'acide nucleique a doner. 

(f) On isole le clone resistant contenant le 
fragment d'acide nucleique a doner par tout moyen 
approprie et ^ventuellement on le sous-clone en 
utilisant les deux sites menages dans le vecteur a cet 
ef fet . 

(g) On sequence eventuellement le fragment 
d'acide nucleique clone. 
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5) Procfede selon les revendications 3 ou 4, 
caract6ris6 en ce qu'il comprend entre les 6tape (a) et 
(b) I'etape suivante : 

(a') on verifie la presence du fragment 
d'acide nucl6ique A doner dans la banque en 
transfectant dans un hote cellulaire qui n'a pas ledit 
fragment et en testant par tout moyen approprife la 
presence du fragment dans ledit hdte. 

6) Precede selon les revendications 4 et 5, 
caracterise en ce qu'il comprend entre les etape (e) et 
(f) l'6tape suivante : 

(e*) On transforme la banque multi-digeree 
de I'^tape (e) dans des hdtes comp6tents, de. fagon a 
verifier la nature des fragments clones. 

7) Precede selon I'une quelconque des 
revendications 1 a 6, caract^ris6 en ce la banque d'ADN 
contient de 1 6 10^ et de preference de I'ordre de 10^ a 
4.10^ fragments differents de I'ordre de 0,1 kb ^ 5 kb 
chacun, et de preference de I'ordre de 1 a 2 kb. 

8) Proc^d6 selon I'une quelconque des 
revendications 3 a 7, caracterise en ce que les tests 
realises aux etapes (d) et/ou (a*) pour verifier 
I'integrite de la sequence d'acide nucleique a doner 
sont tout moyen de mise en evidence soit de la sequence 
elle-meme, comme une sonde, soit de la proteine codee 
par ladite sequence, tel qu'un ligand comme un 
anticorps, ou encore de I'activite de cette proteine, 
comme un marqueur enzymatique, qui peuvent etre 
d^tectees par tout moyen connu de I'homme du metier, 
comme un marquage fluorescent ou radioactif. 

9) Proc6d6 de clonage d'un gene par banque 
d' expression selon I'une quelconque des revendications 1 
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6 1, caract6ris6 en ce qu'il comprend les 6tapes 
suivantes : 

a) On prepare une banque d'ADNc susceptible 
de contenir ledit g^ne en insurant dans un vecteur 
substantiellement d^pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventual lement au moins deux autres sites, 

et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le gene une fois 
celui-ci identifi^ et clon6. 

b) On verifie la presence du gene recherche 
dans la banque en transfectant dans une lign^e 
cellulaire qui n'a pas 1' activity ou le ph6notype 
recherche et en mesurant sa restauration de fagon k 
distinguer les cellules transfect^es des cellules non 

transfect^es. 

c) On digere la banque independamment par au 

moins 10 et de preference environ 50 a 70 enzymes de 
restriction. 

d) On transfecte independamment les banques 

mono-dig6rees de I'etape (c) . 

e) On teste par tout moyen approprie chacun 
des lots obtenus a I'^tape (d) pour la presence de 
I'activite associee au gene a doner et on evalue 
I'integrite de la sequence dudit gene afin d'etablir la 
CEM de I'activite associee audit gene. 

f) On reprend la banque totale de I'etape 
(a) et on la digere sensiblement simultanement par les 
environ 50 ^ 55 enzymes qui n'affectent pas l^activite 

mesuree k l'6tape (e) . 

g) On transforme la banque mult i-digeree 

dans des bacteries competentes. 
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h) On sous-clone en utilisant 1' enzyme 
correspondant au site de sous-clonage m^nag^s dans le 
vecteur, puis eventuellement on sequence le gene. 

10) Proc^de de clonage par homologie selon 
I'une quelconque des revendications 1 a 9, caracteris6 
en ce qu*il comprend les 6tapes suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit fragment d'acide nucleique, consistant 
^ insurer chacun des fragments d'ADN d'un ^chantillon 
dans un vecteur substantiellement d^pourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 

et de pr6ference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d^acide 
nucleique une fois celui-ci identifie et clon6. 

b) On digere la banque independamment par 
chacune d'au moins 10 et de preference environ 50 a 70 
enzymes de restriction. 

• c) On transforme les produits de la 
digestion de I'etape (b) dans des bacteries comp6tentes. 

d) On fait pousser les bacteries 
transform^es en milieu selectif, de fagon a produire des 
grandes quantit^s des banques digerees d^barrassees des 

produits clives. 

e) Eventuellement on clive separement 
chacune de ces banques par 1' enzyme correspondant au 
site de sous-clonage menage dans le vecteur et I'on 
depose separement chacun des produits de digestion dans 

un puits de gel d' agarose. 

f) f) On fait migrer les produits de 
digestion de I'etape (e) , puis 1 ' on transfere sur 
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membrane par exemple de nitro-cellulose, et I'on hybride 
avec une sonde sp6cifique du g^ne A doner par 
homologie, ou bien I'on depose directement les produits 
de l*6tape (d) sur une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon k ce que le seul vecteur 
resistant soit le vecteur portant le gene k doner. 

11) Application du precede selon la 
revendication 10 k 1 ' identification : 

- d' alleles de differentes souches d' animaux 
de la meme esp^ce, ou de diff6rents individus chez 
1' homme, 

d' equivalents g^niques presents chez 

differentes esp6ces, 

- des epissages alternatifs d' un gene. 

de differents membres d'une familie 

genique . 

12) Precede de Southern Blot 
d' identification d' inserts mettant en oeuvre un proc6de 
de clonage d'une sequence d*acide nucleique selon I'une 
queiconque des revendications 1 ^ 10, caracterise en ce 
qu'il comprend les etapes suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit insert, consistant a inserer chacun 
des fragments d'ADN d'un ^chantillon dans un vecteur 
substantieilement depourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 

et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
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flanquant, utiles pour sous-cloner 1 ' insert une fois 
celui-ci identifi6 et clon6. 

b) On digere c'ette banque par chacune d'au 
moins 10 et de preference environ 50 k 70 enzymes de 
restriction* 

c) On transforme les banques monodig^res 
obtenues ^ I'^tape (b) ci-dessus dans des bact6ries 
comp6tentes, ou des hotes equivalents. 

d) On fait pousser les bact^ries en milieu 
selectif, de fagon k produire des banques dig6r6es 
d^barassees des produits cliv^s. 

e) On clive s6parement chacune de ces 
banques par la ou les enzymes correspondant au (x) 
site(s) de sous-clonage flanquant le ou les sites de 
construction de la banque, et on depose les produits de 
digestion dans les puits d'un gel d' agarose ou 

d' acrylamide . 

f) On fait migrer ce gel et on le transf^re 

sur une membrane par exemple de nitrocellulose, 

g) On utilise les inserts a identifier comme 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen approprie chacun 
des lots obtenus a I'etape (g) pour les associer S une 
CEM. 

13) Precede d*6tude du polymorphisme mettant 
en oeuvre un procede de Southern Blot d' identification 
d' inserts selon la revendication 12, caracterise en ce 
que : 

~ La banque d'ADN genomique de I'^tape (a) 

est issue du sujet etudie. 

- Les inserts. utilises comme sondes sont des 

marqueurs de polymorphisme. 
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14) Proc6d6 d' etude du polymorphisme 
caract6ris6 en ce qu'il comprend les 6tapes suivantes : 

a) On dfefinit la CEM de chacun des marqueurs 
connus de fagon k permettre leur identification par le 
proc6d6 de clonage selon la revendication 3. 

b) On constitue une banque d'ADN g6nomique 
du sujet fetudie consistant ^ insurer chacun des 
fragments d*ADN d'un echantillon dans un vecteur 
substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 

et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le{s) 
flanquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifie et clone. 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attribuees 
aux marqueurs etudifes. 

d) On transforme les banques multidig6r6es 
dans des bacteries competentes. 

e) On cultive ces bacteries en milieu 
liquide ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bacteries 
poussent, par centre, si cet allele n' existe pas, elles 
ne poussent pas, et I'on dispose ainsi d»un profil pour 
chaque allele. 

15) Melange d'au moins 10 et de prfef^rence 
de 50 a 70 enzymes de restriction susceptible d'etre 
utilise dans un proc§d6 selon I'une quelconque des 
revendications 1 a 14. 
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16) Utilisation d^un vecteur 

substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 

d'une banque^ et 

- eventual lament au moins deux autres sites, 

et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 

ladite banque, 

pour cribler une banque d'ADN. 

r 

17) Une banque d'acide nucl^ique clon6e dans 
un vecteur susceptible d'etre pr6par6e dans un precede 
selon l*une quelconque das revandications 1 a 14, 
caract^ris^ en ce que ledit vecteur est 
substantiellement depourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au raoins deux autres sites, 

et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

18) Une banque selon la revendication 16, 
caract^risee en ce que le vecteur porte un systeme qui 
elimine tout vecteur seul refarme sur lui-meme. 

19) Une banque d'ADN selon 1 ' une des 
revandications 16 ou 11, caracterisfee en ce qu'elle est 
multi-digeree par un melange d' enzymes selon la 
revendication 15. 



wo 99/28451 



41 



PCT/FR98/02629 



20) Un groupe de banques d'ADN selon I'une 
des revendications 16 ou 17, caract6ris6e en ce qu'elle 
est inono-dig6r§e indfependamment par chacune des enzyme 
du melange d* enzymes selon la revendication 15. 

21) Les hotes cellulaires ou bacteriens 
contenant une banque ou un groupe de banques selon I'une 
des revendications 19 ou 20- 

22) Support port ant une banque ou un groupe 
de banques selon I'une des revendications 19 ou 20 ou 
des hates cellulaires selon la revendication 21. 
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! : Extratl cellulairc dc cellules non iransfccldcs. 

2: Exirait cellulairc de cellules transfeciees par la banquc totalc. 

3: Exiraii ceUuiaiic oc cellules irJirisfcctdcs par la bancjiic digercc par !. 

4: Extrait cellulairc de cellules iransfccldcs par la banquc dig£r6e par LXX. 
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Fig. 12 
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